给Transformer降降秩,移除特定层90%以上组件LLM性能不减 关键词: LLM,Transformer,GPT-J MIT、微软联合研究:不需要额外训练,也能增强大语言模型的任务性能并降低其大小。 来自主题: AI资讯 1454 点击 2023-12-26 14:55